主题
YOLO 模块总览 - Overview
本分类做什么
提供基于 YOLO 的深度学习推理能力,覆盖五类任务:
| 任务 | inferenceType | 典型输出 |
|---|---|---|
| 目标检测 Detect | 0 | 轴对齐框、类别、置信度 |
| 图像分类 Classify | 1 | Top-K 类别与分数(无 bbox) |
| 实例分割 Segment | 2 | 框 + 掩码轮廓 MaskVertices |
| 姿态估计 Pose | 3 | 人体框 + Keypoints |
| 旋转框 Obb | 4 | 旋转四边形 + Angle |
输入一般为 屏幕区域、图像句柄(与 LoadImage 衔接)或 图片路径;confidence / iou / topK 等含义见 推理输入参数说明;输出为 PascalCase JSON(见 推理结果JSON说明)。
一、与「图像识别 Match/Find」的差异
| 对比项 | YOLO(本分类) | 图像识别 Match/Find |
|---|---|---|
| 依据 | 深度学习模型,多类别 | 模板相似度 或 色差扫描 |
| 模板 | 需 权重/加密包 | 用户提供 小图模板 |
| 适用 | 类别多、形变光照大 | 固定 UI 图标、模板稳定 |
选型:UI 固定且可截模板 → Match 往往更轻;多类物体、形变大 → YOLO。
二、典型流水线
- YoloLoadModelEx 或 YoloLoadModel 得到
modelHandle。 - 可选 YoloSetModelConfig、YoloSetModelConfigByKey、YoloGetModelInfo。
- GetScreenDataPtr / LoadImage 或直接屏幕/文件推理。
- 调用对应
YoloDetect*/YoloClassify*/ …,解析 JSON 后 FreeStringPtr。 - YoloReleaseModel 释放句柄。
三、模型类型与设备
modelType:0 TensorRT Engine,1 ONNX,2 NCNN(.bin + .param)。
inferenceType:0 Detect,1 Classify,2 Segment,3 Pose,4 Obb;加载时须与权重任务一致。
inferenceDevice:-1 CPU;0+ GPU 索引;不可用时可能回退 CPU(见 ModelInfo 的 ProviderFallbackReason)。
四、加密包
可使用 YoloEncryptModel 打包分发,运行时 YoloLoadModel 加载。
五、侧栏文档结构
- YOLO 索引 — 全部 28 个导出 API 链接表
- 推理输入参数、推理结果 JSON、ModelInfo / Config
- 每个导出函数独立详情页(命名:
中文名 - 函数名)
未在 ola_yolos.def 导出的头文件接口(如 YoloInfer、YoloWarmup)暂无对外文档页。
